from langchain.embeddings import OllamaEmbeddings
from langchain.vectorstores import Chroma

# 使用 Ollama 的 bge - m3 模型创建嵌入
embeddings = OllamaEmbeddings(model="bge-m3")

# 假设 texts 已经在前面步骤中正确定义
# 这里简单模拟一下 texts 的定义，实际使用时请替换为正确的 texts
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
loader = TextLoader('../../Data/JourneyToTheWest.txt')
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 创建向量数据库
db = Chroma.from_documents(texts, embeddings)

# 保存向量数据库
# db.persist()
